Analisa Sentimen Data Text Preprocessing Pada Data Mining Dengan Menggunakan Machine Learning
نویسندگان
چکیده
Teks merupakan data perhari yang sangat mudah dihasilkan di zaman media sosial ini. Dengan banyaknya teks tersedia internet, <em>data mining</em> seperti analisa sentimen dapat dilakukan untuk kebutuhan strategis. Namun melakukan preprocessing pada masih mendapatkan tantangan tersendiri. Seperti perlakuan <em>stopwords</em>, <em>stemming</em> atau normalisasi dalam tahap ini tentunya akan mempengaruhi akurasi dari hasil mining tersebut. Oleh karena itu penelitian melihat pengaruh terhadap model dengan machine learning. Classifier digunakan adalah Naïve Bayes pengklasifikasian sentiment ulasan positif negatif. Dan dataset 50.000 <em>Internet Movie Database</em> (IMDB) dibagi menjadi 25.000 <em>training set</em> dan <em>testing set</em>. Di masing-masing itu, terdapat 12.500 tersebut, tiga berbeda yaitu; Baseline dimana dibiarkan original tidak apa-apa, Stopwords kata-kata berulang dianggap sebagai kata penghubung klausal dihapus menyisakan kalimat intinya saja, Stemming dinormalisasi dipotong akar kalimatnya saja. Ketiga diimplemetasikan <em>model learning</em> sentimen. Ulasan baru juga dibuat menguji ketiga Tentunya didapatkan Hal membuktikan bahwa preprocessing</em> berpengaruh dilakukan. Dalam ini, paling tinggi akurasinya
منابع مشابه
Multidimensi Pada Data Warehouse Dengan Menggunakan Rumus Kombinasi
Multidimensional in data warehouse is a compulsion and become the most important for information delivery, without multidimensional data warehouse is incomplete. Multidimensional give the able to analyze business measurement in many different ways. Multidimensional is also synonymous with online analytical processing (OLAP).
متن کاملValidasi data dengan menggunakan objek lookup pada borland delphi 7.0
s: Developing an application with some tables must concern the validation of input (scpecially in Table Child). In order to maximize the accuracy and input data validation. Its called lookup (took data from other dataset). There are 2 (two) ways to lookup data from Table Parent: 1) Using Objects (DBLookupComboBox & DBLookupListBox), or 2) Arranging The Properties Of Fields Data Type (shown by u...
متن کاملEnhancing Learning from Imbalanced Classes via Data Preprocessing: A Data-Driven Application in Metabolomics Data Mining
This paper presents a data mining application in metabolomics. It aims at building an enhanced machine learning classifier that can be used for diagnosing cachexia syndrome and identifying its involved biomarkers. To achieve this goal, a data-driven analysis is carried out using a public dataset consisting of 1H-NMR metabolite profile. This dataset suffers from the problem of imbalanced classes...
متن کاملDeterminants of systolic blood pressure in Indonesian elderly men:
Tujuan penelitian ini adalah untuk mengetahui determinan tekanan darah sistolik pada kelompok lanjut usia pria. Suatu studi dengan rancangan ‘cross sectional’ dilakukan di 4 kota besar di Indonesia dengan menggunakan metoda ‘multistage random sampling’. Jumlah responden 320 orang lanjut usia pria, yang merupakan sub-sampel dari 981 responden pada penelitian yang lebih besar. Pengumpulan data di...
متن کاملMachine Learning Through Data Mining
INTRODUCTION In dealing with information it often turns out that one has to face a huge amount of data, often not completely homogeneous and often without an immediate grasp of an underlying simple structure. Many records, each one instantiating many variables, are usually collected with the help of various technologies. Given the opportunity to have so many data not easy to correlate by the hu...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ژورنال
عنوان ژورنال: Journal of business and audit information system
سال: 2021
ISSN: ['2620-7907', '2615-6431']
DOI: https://doi.org/10.30813/jbase.v4i2.3000